۱۶ شهریور ۱۴۰۴فارسی

خط لوله انقلابی مِش شیدر WebGL را کاوش کنید. بیاموزید که چگونه تقویت وظیفه، تولید هندسه عظیم در لحظه و حذف پیشرفته را برای گرافیک وب نسل بعد ممکن می‌سازد.

آزادسازی هندسه: نگاهی عمیق به خط لوله تقویت وظیفه مِش شیدر در WebGL

وب دیگر یک رسانه ایستا و دو بعدی نیست. این رسانه به یک پلتفرم پر جنب و جوش برای تجربیات سه بعدی غنی و فراگیر تبدیل شده است، از پیکربندی‌های محصول و تجسم‌های معماری نفس‌گیر گرفته تا مدل‌های داده پیچیده و بازی‌های تمام عیار. با این حال، این تکامل، تقاضاهای بی‌سابقه‌ای را بر واحد پردازش گرافیکی (GPU) تحمیل می‌کند. برای سال‌ها، خط لوله گرافیکی استاندارد بی‌درنگ، با وجود قدرتمند بودن، کهنگی خود را نشان داده و اغلب به عنوان یک گلوگاه برای نوع پیچیدگی هندسی که برنامه‌های کاربردی مدرن نیاز دارند، عمل می‌کند.

وارد خط لوله مِش شیدر شوید، یک ویژگی تغییردهنده پارادایم که اکنون از طریق افزونه WEBGL_mesh_shader در وب قابل دسترسی است. این مدل جدید اساساً نحوه تفکر ما در مورد پردازش هندسه بر روی GPU را تغییر می‌دهد. در قلب آن یک مفهوم قدرتمند نهفته است: تقویت وظیفه (Task Amplification). این فقط یک به‌روزرسانی تدریجی نیست؛ بلکه یک جهش انقلابی است که منطق زمان‌بندی و تولید هندسه را از CPU مستقیماً به معماری بسیار موازی GPU منتقل می‌کند و امکاناتی را که قبلاً در یک مرورگر وب غیرعملی یا غیرممکن بود، باز می‌کند.

این راهنمای جامع شما را به یک غواصی عمیق در خط لوله هندسه مِش شیدر می‌برد. ما معماری آن را بررسی خواهیم کرد، نقش‌های متمایز شیدرهای Task و Mesh را درک خواهیم کرد و کشف خواهیم کرد که چگونه می‌توان از تقویت وظیفه برای ساخت نسل بعدی برنامه‌های کاربردی وب خیره‌کننده و با کارایی بالا استفاده کرد.

یک بازگشت سریع: محدودیت‌های خط لوله هندسی سنتی

برای درک واقعی نوآوری مِش شیدرها، ابتدا باید خط لوله‌ای را که جایگزین آن شده‌اند، درک کنیم. برای دهه‌ها، گرافیک بی‌درنگ تحت سلطه یک خط لوله با عملکرد نسبتاً ثابت بوده است:

شیدر رأس (Vertex Shader): رئوس منفرد را پردازش کرده و آنها را به فضای صفحه نمایش تبدیل می‌کند.
(اختیاری) شیدرهای موزاییک‌کاری (Tessellation Shaders): تکه‌های هندسه را برای ایجاد جزئیات دقیق‌تر تقسیم‌بندی می‌کنند.
(اختیاری) شیدر هندسه (Geometry Shader): می‌تواند اشکال اولیه (نقاط، خطوط، مثلث‌ها) را در لحظه ایجاد یا از بین ببرد.
رسترایزر (Rasterizer): اشکال اولیه را به پیکسل تبدیل می‌کند.
شیدر فرگمنت (Fragment Shader): رنگ نهایی هر پیکسل را محاسبه می‌کند.

این مدل به خوبی به ما خدمت کرد، اما محدودیت‌های ذاتی دارد، به خصوص با افزایش پیچیدگی صحنه‌ها:

فراخوانی‌های ترسیم وابسته به CPU: پردازنده مرکزی (CPU) وظیفه عظیمی برای تشخیص دقیق آنچه باید ترسیم شود را بر عهده دارد. این شامل حذف بر اساس مخروط دید (frustum culling - حذف اشیاء خارج از دید دوربین)، حذف بر اساس انسداد (occlusion culling - حذف اشیاء پنهان شده توسط اشیاء دیگر)، و مدیریت سیستم‌های سطح جزئیات (LOD) است. برای صحنه‌ای با میلیون‌ها شیء، این می‌تواند منجر به تبدیل شدن CPU به گلوگاه اصلی شود، که قادر به تغذیه GPU گرسنه با سرعت کافی نیست.
ساختار ورودی صلب: این خط لوله حول یک مدل پردازش ورودی صلب ساخته شده است. اسمبلر ورودی (Input Assembler) رئوس را یکی یکی تغذیه می‌کند و شیدرها آنها را به شیوه‌ای نسبتاً محدود پردازش می‌کنند. این برای معماری‌های مدرن GPU که در پردازش داده‌های موازی و منسجم برتری دارند، ایده‌آل نیست.
تقویت ناکارآمد: در حالی که شیدرهای هندسه امکان تقویت هندسه (ایجاد مثلث‌های جدید از یک شکل اولیه ورودی) را فراهم می‌کردند، به طور بدنامی ناکارآمد بودند. رفتار خروجی آنها اغلب برای سخت‌افزار غیرقابل پیش‌بینی بود، که منجر به مشکلات عملکردی می‌شد که آنها را برای بسیاری از برنامه‌های کاربردی در مقیاس بزرگ غیرقابل استفاده می‌کرد.
کار هدر رفته: در خط لوله سنتی، اگر شما یک مثلث را برای رندر ارسال کنید، شیدر رأس سه بار اجرا می‌شود، حتی اگر آن مثلث در نهایت حذف شود یا یک نوار نازک به ضخامت یک پیکسل با رویه پشتی باشد. قدرت پردازشی زیادی صرف هندسه‌ای می‌شود که هیچ کمکی به تصویر نهایی نمی‌کند.

تغییر پارادایم: معرفی خط لوله مِش شیدر

خط لوله مِش شیدر مراحل شیدر رأس، موزاییک‌کاری و هندسه را با یک مدل دو مرحله‌ای جدید و انعطاف‌پذیرتر جایگزین می‌کند:

شیدر وظیفه (Task Shader) (اختیاری): یک مرحله کنترلی سطح بالا که تعیین می‌کند چه مقدار کار باید انجام شود. همچنین به عنوان شیدر تقویت (Amplification Shader) نیز شناخته می‌شود.
شیدر مِش (Mesh Shader): مرحله کاری اصلی که بر روی دسته‌هایی از داده‌ها برای تولید بسته‌های کوچک و مستقل هندسه به نام «مشلت» (meshlet) عمل می‌کند.

این رویکرد جدید اساساً فلسفه رندرینگ را تغییر می‌دهد. به جای اینکه CPU هر فراخوانی ترسیم را برای هر شیء به صورت ریز مدیریت کند، اکنون می‌تواند یک دستور ترسیم قدرتمند و واحد صادر کند که اساساً به GPU می‌گوید: «این یک توصیف سطح بالا از یک صحنه پیچیده است؛ تو جزئیات را مشخص کن.»

سپس GPU، با استفاده از شیدرهای Task و Mesh، می‌تواند حذف، انتخاب LOD و تولید رویه‌ای را به شیوه‌ای بسیار موازی انجام دهد و تنها کارهای لازم برای تولید هندسه‌ای که واقعاً قابل مشاهده خواهد بود را راه‌اندازی کند. این جوهر یک خط لوله رندرینگ مبتنی بر GPU است، و یک تغییردهنده بازی برای عملکرد و مقیاس‌پذیری است.

رهبر ارکستر: درک شیدر وظیفه (تقویت)

شیدر وظیفه مغز خط لوله جدید و کلید قدرت باورنکردنی آن است. این یک مرحله اختیاری است، اما جایی است که «تقویت» اتفاق می‌افتد. نقش اصلی آن تولید رئوس یا مثلث‌ها نیست، بلکه عمل به عنوان یک توزیع‌کننده کار است.

شیدر وظیفه چیست؟

یک شیدر وظیفه را مانند یک مدیر پروژه برای یک پروژه ساختمانی عظیم در نظر بگیرید. CPU یک هدف سطح بالا به مدیر می‌دهد، مانند «یک منطقه شهری بساز». مدیر پروژه (شیدر وظیفه) خودش آجرچینی نمی‌کند. در عوض، وظیفه کلی را ارزیابی می‌کند، نقشه‌ها را بررسی می‌کند و تعیین می‌کند که کدام تیم‌های ساختمانی (گروه‌های کاری شیدر مِش) و به چه تعداد مورد نیاز هستند. می‌تواند تصمیم بگیرد که یک ساختمان خاص مورد نیاز نیست (حذف) یا یک منطقه خاص به ده تیم نیاز دارد در حالی که دیگری فقط به دو تیم نیاز دارد.

از نظر فنی، یک شیدر وظیفه به عنوان یک گروه کاری شبیه به محاسباتی (compute-like) اجرا می‌شود. می‌تواند به حافظه دسترسی داشته باشد، محاسبات پیچیده انجام دهد و مهمتر از همه، تصمیم بگیرد که چه تعداد گروه کاری شیدر مِش راه‌اندازی شود. این تصمیم هسته قدرت آن است.

قدرت تقویت

اصطلاح «تقویت» از توانایی شیدر وظیفه برای گرفتن یک گروه کاری از خودش و راه‌اندازی صفر، یک یا چندین گروه کاری شیدر مِش ناشی می‌شود. این قابلیت تحول‌آفرین است:

راه‌اندازی صفر: اگر شیدر وظیفه تشخیص دهد که یک شیء یا بخشی از صحنه قابل مشاهده نیست (مثلاً خارج از مخروط دید دوربین است)، می‌تواند به سادگی تصمیم بگیرد که صفر گروه کاری شیدر مِش راه‌اندازی کند. تمام کارهای بالقوه مرتبط با آن شیء بدون اینکه بیشتر پردازش شوند، ناپدید می‌شوند. این یک حذف فوق‌العاده کارآمد است که به طور کامل بر روی GPU انجام می‌شود.
راه‌اندازی یک: این یک عبور مستقیم است. گروه کاری شیدر وظیفه تصمیم می‌گیرد که یک گروه کاری شیدر مِش مورد نیاز است.
راه‌اندازی چندین: اینجاست که جادو برای تولید رویه‌ای اتفاق می‌افتد. یک گروه کاری شیدر وظیفه می‌تواند برخی پارامترهای ورودی را تجزیه و تحلیل کند و تصمیم بگیرد که هزاران گروه کاری شیدر مِش راه‌اندازی کند. به عنوان مثال، می‌تواند یک گروه کاری برای هر تیغه چمن در یک مزرعه یا هر سیارک در یک خوشه متراکم راه‌اندازی کند، همه از یک دستور ارسال واحد از CPU.

نگاهی مفهومی به GLSL شیدر وظیفه

در حالی که جزئیات می‌توانند پیچیده شوند، مکانیسم اصلی تقویت در GLSL (برای افزونه WebGL) به طرز شگفت‌آوری ساده است. این مکانیسم حول تابع `EmitMeshTasksEXT()` می‌چرخد.

توجه: این یک مثال ساده و مفهومی است.

#version 310 es #extension GL_EXT_mesh_shader : require layout(local_size_x = 32, local_size_y = 1, local_size_z = 1) in; // یونیفرم‌های ارسال شده از CPU uniform mat4 u_viewProjectionMatrix; uniform uint u_totalObjectCount; // یک بافر حاوی کره‌های مرزی برای اشیاء بسیار struct BoundingSphere { vec4 centerAndRadius; }; layout(std430, binding = 0) readonly buffer ObjectBounds { BoundingSphere bounds[]; } objectBounds; void main() { // هر ترد در گروه کاری می‌تواند یک شیء متفاوت را بررسی کند uint objectIndex = gl_GlobalInvocationID.x; if (objectIndex >= u_totalObjectCount) { return; } // حذف بر اساس مخروط دید را روی GPU برای کره مرزی این شیء انجام بده BoundingSphere sphere = objectBounds.bounds[objectIndex]; bool isVisible = isSphereInFrustum(sphere.centerAndRadius, u_viewProjectionMatrix); // اگر قابل مشاهده است، یک گروه کاری شیدر مِش برای ترسیم آن راه‌اندازی کن. // توجه: این منطق می‌تواند پیچیده‌تر باشد، با استفاده از اتمیک‌ها برای شمارش اشیاء قابل مشاهده // و داشتن یک ترد برای ارسال همه آنها. if (isVisible) { // این به GPU می‌گوید که یک وظیفه مِش راه‌اندازی کند. پارامترها می‌توانند برای // انتقال اطلاعات به گروه کاری شیدر مِش استفاده شوند. // برای سادگی، تصور می‌کنیم هر فراخوانی شیدر وظیفه می‌تواند مستقیماً به یک وظیفه مِش نگاشت شود. // یک سناریوی واقعی‌تر شامل گروه‌بندی و ارسال از یک ترد واحد است. // یک ارسال مفهومی ساده‌شده: // ما وانمود می‌کنیم که هر شیء قابل مشاهده وظیفه خود را دریافت می‌کند، اگرچه در واقعیت // یک فراخوانی شیدر وظیفه، ارسال چندین شیدر مِش را مدیریت می‌کند. EmitMeshTasksEXT(1u, 0u, 0u); // این تابع کلیدی تقویت است } // اگر قابل مشاهده نیست، هیچ کاری نمی‌کنیم! شیء با هزینه صفر GPU فراتر از این بررسی حذف می‌شود. }

در یک سناریوی واقعی، ممکن است یک ترد در گروه کاری نتایج را جمع‌آوری کرده و یک فراخوانی واحد `EmitMeshTasksEXT` را برای تمام اشیاء قابل مشاهده‌ای که گروه کاری مسئول آنهاست، انجام دهد.

نیروی کار: نقش شیدر مِش در تولید هندسه

هنگامی که یک شیدر وظیفه یک یا چند گروه کاری را ارسال کرد، شیدر مِش کار را به دست می‌گیرد. اگر شیدر وظیفه مدیر پروژه است، شیدر مِش تیم ساختمانی ماهری است که واقعاً هندسه را می‌سازد.

از گروه‌های کاری تا مشلت‌ها

مانند یک شیدر وظیفه، یک شیدر مِش به عنوان یک گروه کاری مشارکتی از تردها اجرا می‌شود. هدف جمعی کل این گروه کاری تولید یک دسته کوچک و واحد از هندسه به نام مشلت (meshlet) است. یک مشلت به سادگی مجموعه‌ای از رئوس و اشکال اولیه (مثلث‌ها) است که آنها را به هم متصل می‌کند. به طور معمول، یک مشلت شامل تعداد کمی رأس (مثلاً تا ۱۲۸) و مثلث (مثلاً تا ۲۵۶) است، اندازه‌ای که برای کش‌های GPU مدرن و مدل‌های پردازشی بسیار مناسب است.

این یک جدایی اساسی از شیدر رأس است که هیچ مفهومی از همسایگان خود نداشت. در یک شیدر مِش، تمام تردهای موجود در گروه کاری می‌توانند حافظه را به اشتراک بگذارند و تلاش‌های خود را برای ساخت کارآمد مشلت هماهنگ کنند.

تولید رئوس و اشکال اولیه

به جای برگرداندن یک `gl_Position` واحد، یک گروه کاری شیدر مِش آرایه‌های خروجی را با داده‌های کامل برای مشلت خود پر می‌کند. تردها با هم کار می‌کنند تا موقعیت‌های رأس، نرمال‌ها، مختصات UV و سایر ویژگی‌ها را در این آرایه‌ها بنویسند. آنها همچنین اشکال اولیه را با مشخص کردن اینکه کدام رئوس هر مثلث را تشکیل می‌دهند، تعریف می‌کنند.

آخرین مرحله در یک شیدر مِش، فراخوانی تابعی مانند `SetMeshOutputsEXT()` برای اعلام دقیق تعداد رئوس و اشکال اولیه‌ای است که تولید کرده است. سپس سخت‌افزار این مشلت را گرفته و مستقیماً به رسترایزر منتقل می‌کند.

نگاهی مفهومی به GLSL شیدر مِش

در اینجا یک مثال مفهومی از یک شیدر مِش که یک چهارضلعی ساده تولید می‌کند، آورده شده است. توجه کنید که چگونه تردها بر اساس `gl_LocalInvocationID` خود با هم همکاری می‌کنند.

#version 310 es #extension GL_EXT_mesh_shader : require // حداکثر خروجی‌ها را برای مشلت ما تعریف کنید layout(max_vertices = 4, max_primitives = 2) out; layout(triangles) out; layout(local_size_x = 4, local_size_y = 1, local_size_z = 1) in; // ما داده‌های رأس را در این آرایه‌های خروجی داخلی می‌نویسیم out gl_MeshVerticesEXT { vec4 position; vec2 uv; } vertices[]; // ما شاخص‌های مثلث را در این آرایه می‌نویسیم out uint gl_MeshPrimitivesEXT[]; uniform mat4 u_modelViewProjectionMatrix; void main() { // تعداد کل رئوس و اشکال اولیه برای تولید برای این مشلت const uint vertexCount = 4; const uint primitiveCount = 2; // به سخت‌افزار بگویید که واقعاً چه تعداد رأس و شکل اولیه را خروجی می‌دهیم SetMeshOutputsEXT(vertexCount, primitiveCount); // موقعیت‌های رأس و UVها را برای یک چهارضلعی تعریف کنید vec4 positions[4] = vec4[4]( vec4(-0.5, 0.5, 0.0, 1.0), vec4(-0.5, -0.5, 0.0, 1.0), vec4(0.5, 0.5, 0.0, 1.0), vec4(0.5, -0.5, 0.0, 1.0) ); vec2 uvs[4] = vec2[4]( vec2(0.0, 1.0), vec2(0.0, 0.0), vec2(1.0, 1.0), vec2(1.0, 0.0) ); // اجازه دهید هر ترد در گروه کاری یک رأس تولید کند uint id = gl_LocalInvocationID.x; if (id < vertexCount) { vertices[id].position = u_modelViewProjectionMatrix * positions[id]; vertices[id].uv = uvs[id]; } // اجازه دهید دو ترد اول دو مثلث برای چهارضلعی را تولید کنند if (id == 0) { // مثلث اول: 0، 1، 2 gl_MeshPrimitivesEXT[0] = 0u; gl_MeshPrimitivesEXT[1] = 1u; gl_MeshPrimitivesEXT[2] = 2u; } if (id == 1) { // مثلث دوم: 1، 3، 2 gl_MeshPrimitivesEXT[3] = 1u; gl_MeshPrimitivesEXT[4] = 3u; gl_MeshPrimitivesEXT[5] = 2u; } }

جادوی عملی: موارد استفاده برای تقویت وظیفه

قدرت واقعی این خط لوله زمانی آشکار می‌شود که آن را برای چالش‌های رندرینگ پیچیده و واقعی به کار می‌بریم.

مورد استفاده ۱: تولید هندسه رویه‌ای عظیم

تصور کنید در حال رندر کردن یک میدان سیارکی متراکم با صدها هزار سیارک منحصر به فرد هستید. با خط لوله قدیمی، CPU باید داده‌های رأس هر سیارک را تولید کرده و برای هر کدام یک فراخوانی ترسیم جداگانه صادر کند، رویکردی کاملاً غیرقابل دفاع.

گردش کار مِش شیدر:

CPU یک فراخوانی ترسیم واحد صادر می‌کند: `drawMeshTasksEXT(1, 1)`. همچنین برخی پارامترهای سطح بالا، مانند شعاع میدان و تراکم سیارک‌ها را در یک بافر یونیفرم ارسال می‌کند.
یک گروه کاری شیدر وظیفه واحد اجرا می‌شود. پارامترها را می‌خواند و محاسبه می‌کند که، مثلاً، ۵۰,۰۰۰ سیارک مورد نیاز است. سپس `EmitMeshTasksEXT(50000, 0, 0)` را فراخوانی می‌کند.
GPU به صورت موازی ۵۰,۰۰۰ گروه کاری شیدر مِش راه‌اندازی می‌کند.
هر گروه کاری شیدر مِش از شناسه منحصر به فرد خود (`gl_WorkGroupID`) به عنوان یک بذر برای تولید رویه‌ای رئوس و مثلث‌ها برای یک سیارک منحصر به فرد استفاده می‌کند.

نتیجه یک صحنه عظیم و پیچیده است که تقریباً به طور کامل بر روی GPU تولید شده و CPU را برای رسیدگی به وظایف دیگر مانند فیزیک و هوش مصنوعی آزاد می‌کند.

مورد استفاده ۲: حذف مبتنی بر GPU در مقیاس بزرگ

یک صحنه شهری با جزئیات و میلیون‌ها شیء منفرد را در نظر بگیرید. CPU به سادگی نمی‌تواند قابلیت مشاهده هر شیء را در هر فریم بررسی کند.

گردش کار مِش شیدر:

CPU یک بافر بزرگ حاوی حجم‌های مرزی (مثلاً کره‌ها یا جعبه‌ها) را برای هر شیء منفرد در صحنه آپلود می‌کند. این کار یک بار، یا فقط زمانی که اشیاء حرکت می‌کنند، اتفاق می‌افتد.
CPU یک فراخوانی ترسیم واحد صادر می‌کند و به تعداد کافی گروه کاری شیدر وظیفه راه‌اندازی می‌کند تا کل لیست حجم‌های مرزی را به صورت موازی پردازش کند.
به هر گروه کاری شیدر وظیفه بخشی از لیست حجم‌های مرزی اختصاص داده می‌شود. این گروه کاری در میان اشیاء اختصاص داده شده خود تکرار می‌کند، حذف بر اساس مخروط دید (و بالقوه حذف بر اساس انسداد) را برای هر یک انجام می‌دهد و تعداد قابل مشاهده‌ها را می‌شمارد.
در نهایت، دقیقاً به همان تعداد گروه کاری شیدر مِش راه‌اندازی می‌کند و شناسه‌های اشیاء قابل مشاهده را به آنها منتقل می‌کند.
هر گروه کاری شیدر مِش یک شناسه شیء دریافت می‌کند، داده‌های مِش آن را از یک بافر جستجو می‌کند و مشلت‌های مربوطه را برای رندرینگ تولید می‌کند.

این کار کل فرآیند حذف را به GPU منتقل می‌کند و امکان ایجاد صحنه‌هایی با پیچیدگی را فراهم می‌کند که فوراً یک رویکرد مبتنی بر CPU را از کار می‌اندازد.

مورد استفاده ۳: سطح جزئیات (LOD) پویا و کارآمد

سیستم‌های LOD برای عملکرد حیاتی هستند و برای اشیائی که دور هستند به مدل‌های ساده‌تر تغییر می‌کنند. مِش شیدرها این فرآیند را دانه‌ای‌تر و کارآمدتر می‌کنند.

گردش کار مِش شیدر:

داده‌های یک شیء به صورت سلسله مراتبی از مشلت‌ها پیش‌پردازش می‌شود. LODهای درشت‌تر از مشلت‌های کمتر و بزرگتر استفاده می‌کنند.
یک شیدر وظیفه برای این شیء فاصله آن را از دوربین محاسبه می‌کند.
بر اساس فاصله، تصمیم می‌گیرد که کدام سطح LOD مناسب است. سپس می‌تواند حذف را بر اساس هر مشلت برای آن LOD انجام دهد. به عنوان مثال، برای یک شیء بزرگ، می‌تواند مشلت‌های سمت پشتی شیء را که قابل مشاهده نیستند، حذف کند.
این فقط گروه‌های کاری شیدر مِش را برای مشلت‌های قابل مشاهده از LOD انتخاب شده راه‌اندازی می‌کند.

این امکان انتخاب و حذف LOD به صورت دانه‌ریز و در لحظه را فراهم می‌کند که بسیار کارآمدتر از تعویض کل مدل‌ها توسط CPU است.

شروع کار: استفاده از افزونه `WEBGL_mesh_shader`

آماده آزمایش هستید؟ در اینجا مراحل عملی برای شروع کار با مِش شیدر در WebGL آورده شده است.

بررسی پشتیبانی

اول از همه، این یک ویژگی بسیار جدید است. شما باید تأیید کنید که مرورگر و سخت‌افزار کاربر از آن پشتیبانی می‌کنند.

const gl = canvas.getContext('webgl2'); const meshShaderExtension = gl.getExtension('WEBGL_mesh_shader'); if (!meshShaderExtension) { console.error("Your browser or GPU does not support WEBGL_mesh_shader."); // به یک مسیر رندرینگ سنتی بازگردید }

فراخوانی ترسیم جدید

فراموش کنید `drawArrays` و `drawElements` را. خط لوله جدید با یک دستور جدید فراخوانی می‌شود. شیء افزونه‌ای که از `getExtension` دریافت می‌کنید، حاوی توابع جدید خواهد بود.

// ۱۰ گروه کاری شیدر وظیفه راه‌اندازی کنید. // هر گروه کاری اندازه محلی تعریف شده در شیدر را خواهد داشت. meshShaderExtension.drawMeshTasksEXT(0, 10);

آرگومان `count` مشخص می‌کند که چه تعداد گروه کاری محلی از شیدر وظیفه راه‌اندازی شود. اگر از شیدر وظیفه استفاده نمی‌کنید، این مستقیماً گروه‌های کاری شیدر مِش را راه‌اندازی می‌کند.

کامپایل و پیوند شیدر

این فرآیند شبیه به GLSL سنتی است، اما شما شیدرهایی از نوع `meshShaderExtension.MESH_SHADER_EXT` و `meshShaderExtension.TASK_SHADER_EXT` ایجاد خواهید کرد. شما آنها را همانطور که یک شیدر رأس و فرگمنت را به هم پیوند می‌دهید، در یک برنامه به هم پیوند می‌دهید.

مهمتر از همه، کد منبع GLSL شما برای هر دو شیدر باید با دستورالعمل فعال‌سازی افزونه شروع شود:

#extension GL_EXT_mesh_shader : require

ملاحظات عملکرد و بهترین شیوه‌ها

اندازه گروه کاری مناسب را انتخاب کنید: `layout(local_size_x = N)` در شیدر شما حیاتی است. اندازه ۳۲ یا ۶۴ اغلب نقطه شروع خوبی است، زیرا به خوبی با معماری‌های سخت‌افزاری زیربنایی هماهنگ است، اما همیشه برای یافتن اندازه بهینه برای بار کاری خاص خود، پروفایل‌گیری کنید.
شیدر وظیفه خود را سبک نگه دارید: شیدر وظیفه یک ابزار قدرتمند است، اما همچنین یک گلوگاه بالقوه است. حذف و منطقی که در اینجا انجام می‌دهید باید تا حد امکان کارآمد باشد. از محاسبات کند و پیچیده اگر می‌توانند از قبل محاسبه شوند، خودداری کنید.
اندازه مشلت را بهینه کنید: یک نقطه بهینه وابسته به سخت‌افزار برای تعداد رئوس و اشکال اولیه در هر مشلت وجود دارد. `max_vertices` و `max_primitives` که اعلام می‌کنید باید با دقت انتخاب شوند. اگر خیلی کوچک باشد، سربار راه‌اندازی گروه‌های کاری غالب می‌شود. اگر خیلی بزرگ باشد، موازی‌سازی و کارایی کش را از دست می‌دهید.
انسجام داده‌ها اهمیت دارد: هنگام انجام حذف در شیدر وظیفه، داده‌های حجم مرزی خود را در حافظه به گونه‌ای ترتیب دهید که الگوهای دسترسی منسجم را ترویج کند. این به کش‌های GPU کمک می‌کند تا به طور مؤثر کار کنند.
بدانید چه زمانی از آنها اجتناب کنید: مِش شیدرها یک راه‌حل جادویی نیستند. برای رندر کردن تعداد انگشت‌شماری از اشیاء ساده، سربار خط لوله مِش ممکن است کندتر از خط لوله رأس سنتی باشد. از آنها در جایی استفاده کنید که نقاط قوتشان می‌درخشد: تعداد زیاد اشیاء، تولید رویه‌ای پیچیده، و بارهای کاری مبتنی بر GPU.

نتیجه‌گیری: آینده گرافیک بی‌درنگ در وب اکنون است

خط لوله مِش شیدر با تقویت وظیفه یکی از مهم‌ترین پیشرفت‌ها در گرافیک بی‌درنگ در دهه گذشته را نشان می‌دهد. با تغییر پارادایم از یک فرآیند سفت و سخت و مدیریت شده توسط CPU به یک فرآیند انعطاف‌پذیر و مبتنی بر GPU، موانع قبلی بر سر راه پیچیدگی هندسی و مقیاس صحنه را در هم می‌شکند.

این فناوری، همسو با جهت APIهای گرافیکی مدرن مانند Vulkan، DirectX 12 Ultimate و Metal، دیگر به برنامه‌های نیتیو پیشرفته محدود نمی‌شود. ورود آن به WebGL در را برای عصر جدیدی از تجربیات مبتنی بر وب باز می‌کند که جزئیات بیشتر، پویاتر و فراگیرتر از همیشه هستند. برای توسعه‌دهندگانی که مایل به پذیرش این مدل جدید هستند، امکانات خلاقانه تقریباً بی حد و حصر است. قدرت تولید کل دنیاها در لحظه، برای اولین بار، به معنای واقعی کلمه در نوک انگشتان شما، درست در داخل یک مرورگر وب قرار دارد.